AI资讯新闻榜单内容搜索-deepseek r

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报

6804 点击 2025-11-21 09:16

啊？微博7800美元训的大模型，数学能力超了DeepSeek-R1

近日，微博正式发布首个自研开源大模型VibeThinker，这个仅拥有15亿参数的“轻量级选手”，在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。

来自主题: AI资讯

7282 点击 2025-11-18 16:34

小米最新大模型成果！罗福莉现身了

小米的最新大模型科研成果，对外曝光了。就在最近，小米AI团队携手北京大学联合发布了一篇聚焦MoE与强化学习的论文。而其中，因为更早之前在DeepSeek R1爆火前转会小米的罗福莉，也赫然在列，还是通讯作者。

来自主题: AI技术研报

7741 点击 2025-10-17 16:44

700万参数击败DeepSeek R1等，三星一人独作爆火，用递归颠覆大模型推理

来自加拿大蒙特利尔三星先进技术研究所（SAIT）的高级 AI 研究员 Alexia Jolicoeur-Martineau 介绍了微型递归模型（TRM）。这个 TRM 有多离谱呢？一个仅包含 700 万个参数（比 HRM 还要小 4 倍）的网络，在某些最困难的推理基准测试中，

来自主题: AI技术研报

8185 点击 2025-10-10 13:08

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

7226 点击 2025-09-03 11:22